有效前沿都是通过有效单元的连接获取的, 用分段线性近似法得到边界曲线。任意两个有效单元之间的点 (如下图) 都被称作这两个决策单元的凸集。换句话说. DEA 前沿就是由有效决策单元的凸 组合得到的。

$A$ 和 $B$ 的凸组合形式可以表示成 $\lambda_A A+\lambda_B B$, 并且 $\lambda_A$ 和 $\lambda_B$ 是非负性的, 且 $\lambda_A+\lambda_B=1$, 通过对 $\lambda_A$ 和 $\lambda_B$ 不同的赋值, 可以得到不同的凸组合。例如, 考虑图 $2.4$ 中 $B_1 B_2$ 上的点 $\left(x_1, x_2\right)=(5,50)$, 我们想要知道 $\lambda_{B 1}$ 和 $\lambda_{B 2}$, 可通过$\lambda_{B_1} \times B_1+\lambda_{B_2} \times B_2=(5,50)$, 进一步有 $$ \left.\begin{array}{l} 2 \lambda_{B_1}+6 \lambda_{B_2}=5 \\ 80 \lambda_{B_1}+40 \lambda_{B_2}=50 \end{array}\right\} $$ 联立方程: $$ \left.\begin{array}{l} 2 \lambda_{B_1}+6 \lambda_{B_2}=5 \\ 2 \lambda_{B_1}+\lambda_{B_2}=1.25 \end{array}\right\} $$ 解得 $5 \lambda_{B_2}=3.75$, 即 $\lambda_{B_2}=0.75, \lambda_{B_1}=0.25$, 即 $0.25 \times B_1+0.75 \times B_2=(5,50)$ 。 注意到位于 $B_1$ 与 $B_2$ 之间的点, 总会满足 $\lambda_{B_1}+\lambda_{B_2}=1$ 且 $\lambda_{B_1}, \lambda_{B_2} \geqslant 0$ 。 实际 上. 过 $B_1$ 与 $B_2$ 的直线上的任意点坐标 $\left(x_1, x_2\right)=\left(2 \lambda_{B_1}+6 \lambda_{B_2}, 80 \lambda_{B_1}+40 \lambda_{B_2}\right)$, $\lambda_{B_1}+\lambda_{B_2}=1$, 且 $\lambda_{B_1}, \lambda_{B_2} \geqslant 0$ 。

回忆前面讲的评价大学效率的例子, 在构建虚拟决策单元时, 我们会假定 $\lambda_A$, $\lambda_B, \lambda_C$ 满足 $\lambda_A+\lambda_B+\lambda_C=1$, 即在得知虚拟决策单元的输入是原始决策单元的输入的凸组合下, 可知虚拟决策单元就是原始单元的凸集。当有效决策单元确定之后,那么有效虚拟决策单元就是有效决策单元的凸集。

权重的数目是跟观察决策单元的数量有关的, 表中共有15 个最佳财富城市 (Zhu,2001), 这里财富杂志选择了一系列的衡量指标来对生活质量测量, 我们只选取了三个输入指标及两个输出指标。三个输入指标是: (1) 高档房屋价格 (以 美元为单位);(2)低档房屋月租 (美元);(3)一块法式面包的价格 (美元)。两个输出 指标是: (1)医生总数 (以千人为单位); (2)中等家庭收入 (美元)。在这个例子中, 由于总共有 15 个城市 (决策单元), 为了构建虚拟决策单元, 我们共需要 15 个权重 (即 $\left.\lambda_1, \lambda_2, \cdots, \lambda_{15}\right)$. 虚拟决策单元可以用三个输入指标和两个输出指标的凸集合表示: 虚拟决策单元的房屋价格可表示为 $$ \begin{aligned} &586000 \lambda_1+475000 \lambda_2+201000 \lambda_3+299000 \lambda_4+318000 \lambda_5+265000 \lambda_6 \\ &+467000 \lambda_7+583000 \lambda_8+347000 \lambda_9+296000 \lambda_{10}+600000 \lambda_{11}+575000 \lambda_{12} \\ &+351000 \lambda_{13}+283000 \lambda_{14}+431000 \lambda_{15} \end{aligned} $$ 虚拟决策单元的租金可表示为 $$ \begin{aligned} &581 \lambda_1+558 \lambda_2+600 \lambda_3+609 \lambda_4+613 \lambda_5+558 \lambda_6+580 \lambda_7+625 \lambda_8 \\ &+535 \lambda_9+650 \lambda_{10}+740 \lambda_{11}+775 \lambda_{12}+888 \lambda_{13}+727 \lambda_{14}+695 \lambda_{15} \end{aligned} $$ 虚拟决策单元的面包价格可表示为 $$ \begin{aligned} &1.45 \lambda_1+0.97 \lambda_2+1.5 \lambda_3+1.49 \lambda_4+0.99 \lambda_5+0.89 \lambda_6+1.25 \lambda_7+1.29 \lambda_8 \\ &+0.99 \lambda_9+1.5 \lambda_{10}+1.19 \lambda_{11}+0.99 \lambda_{12}+1.09 \lambda_{13}+1.53 \lambda_{14}+1.19 \lambda_{15} \end{aligned} $$ 虚拟决策单元的医生数可表示为 $$ \begin{aligned} &4.49 \lambda_1+2.79 \lambda_2+3.64 \lambda_3+2.67 \lambda_4+4.94 \lambda_5+3.4 \lambda_6+2.8 \lambda_7+3.35 \lambda_8 \\ &+3.66 \lambda_9+1.96 \lambda_{10}+2.23 \lambda_{11}+4.02 \lambda_{12}+5.69 \lambda_{13}+3.11 \lambda_{14}+3.25 \lambda_{15} \end{aligned} $$ 虚拟决策单元的家庭收入可表示为 $$ \begin{aligned} &46928 \lambda_1+42879 \lambda_2+43576 \lambda_3+45673 \lambda_4+40990 \lambda_5+39079 \lambda_6 \\ &+38455 \lambda_7+54291 \lambda_8+34534 \lambda_9+41984 \lambda_{10}+43249 \lambda_{11}+43291 \lambda_{12} \\ &+46444 \lambda_{13}+41841 \lambda_{14}+40221 \lambda_{15} \end{aligned} $$ 由于决策单元的数量不同, 输入与输出在评价不同的问题上也会因此不同。为了使得针对某一特定系列的决策单元进行数据包络分析, 我们提出以下概念:

效率前沿是由这 $n$ 个观测值决定的, 以下两条性质保证了我们可以用分段线性近似法来描绘出效率前沿和其占优区域。

性质1 凸性。 $\sum_{j=1}^n \lambda_j x_{i j}(i=1,2, \cdots, m)$ 和 $\sum_{j=1}^n \lambda_j y_{r j}(r=1,2, \cdots, s)$ 都是 (虚拟决策单元的) 可能的输入及输出值, 其中 $\lambda_j$ 是非负的且 $\sum_{j=1}^n \lambda_j=1_{\text {。 }}$

性质 2 无效性。相同输出 $y_{r j}$ 可以通过使用 $\hat{x}_{i j}$ 获得, 并且 $\hat{x}_{i j} \leqslant x_{i j}$ (即相同输出可以以更多的输入生产得到); 相同输入 $x_{i j}$ 可以获得 $\hat{y}_{r j}$, 且有 $\hat{y}_{r j} \geqslant y_{r j}$ (即 相同输入可用于产生更少的输出)。

对于某个特定观察值 $x_i(i=1,2, \cdots, m)$ 以及 $y_r(r=1,2, \cdots, s)$, 基于性质 $1$ 及性质 $2$, 我们有 $$ \begin{cases}\lambda_1 x_{i 1}+\lambda_2 x_{i 2}+\cdots+\lambda_j x_{i j}+\cdots+\lambda_n x_{i n} \leqslant x_i \quad & i=1,2, \cdots, m \\ \lambda_1 y_{r 1}+\lambda_2 y_{r 2}+\cdots+\lambda_j y_{r j}+\cdots+\lambda_n y_{r n} \geqslant y_r \quad & r=1,2, \cdots, s \\ \lambda_1+\lambda_2+\cdots+\lambda_j+\cdots+\lambda_n=1\end{cases} $$ 下一步就是 确定有效前沿, 即我们是否能矩找到这样的权重组合成的凸集比某一评价单元要有效。如果答案是肯定的, 那么该评价单元不在有效前沿上; 如果答案是否定的, 那么该评价单元就是有效前沿上的点。

参考资料: